智能论文笔记

Fake detection in imbalance dataset by Semi-supervised learning with GAN

Jinus Bordbar , Saman Ardalan , Mohammadreza Mohammadrezaie , Mohammad Ebrahim Shiri

分类：机器学习 | 人工智能

2022-12-02

As social media grows faster, harassment becomes more prevalent which leads to considered fake detection a fascinating field among researchers. The graph nature of data with the large number of nodes caused different obstacles including a considerable amount of unrelated features in matrices as high dispersion and imbalance classes in the dataset. To deal with these issues Auto-encoders and a combination of semi-supervised learning and the GAN algorithm which is called SGAN were used. This paper is deploying a smaller number of labels and applying SGAN as a classifier. The result of this test showed that the accuracy had reached 91\% in detecting fake accounts using only 100 labeled samples.

translated by 谷歌翻译

Low Complexity Classification Approach for Faster-than-Nyquist (FTN) Signalling Detection

Sina Abbasi , Ebrahim Bedeer

分类：机器学习

2022-08-22

比尼奎斯特（FTN）信号更快可以提高光谱效率（SE）；然而，以高计算复杂性为代价，以消除引入的隔膜间干扰（ISI）。由ML在物理层（PHY）问题中取得成功的动机，在本文中，我们研究了ML在降低FTN信号传导的检测复杂性方面的使用。特别是，我们将FTN信号检测问题视为一项分类任务，其中接收的信号被视为属于所有可能类样本的一个未标记的类样本。如果我们使用一个偏离分类器，则所有可能的类样本的集合属于$ n $维空间，其中$ n $是传输块长度，具有巨大的计算复杂性。我们提出了一个低复杂分类器（LCC），该分类器（LCC）利用FTN信号的ISI结构来执行$ n_p \ ll n $ dimension空间中的分类任务。拟议的LCC由两个阶段组成：1）离线预先分类，该预先分类在$ n_p $二维空间中构建标记的类样品和2）在线分类，其中发生了接收样品的检测。提出的LCC也会扩展以产生软输出。仿真结果显示了拟议的LCC在平衡性能和复杂性方面的有效性。

translated by 谷歌翻译

Optimal Transport Features for Morphometric Population Analysis

Samuel Gerber , Marc Niethammer , Ebrahim Ebrahim , Joseph Piven , Stephen R. Dager , Martin Styner , Stephen Aylward , Andinet Enquobahrie

分类：计算机视觉

2022-08-11

脑病理通常表现为组织的部分或完全丧失。许多神经影像学研究的目的是捕获有关感兴趣的临床变量（例如疾病进展）的组织变化的位置和数量。形态分析方法捕获了与临床变量有关的组织分布或其他含量的兴趣分布的局部差异。我们建议通过基于不平衡的最佳传输的附加特征提取步骤来增强形态分析。最佳运输特征提取步骤增加了导致空间分散组织损失的病理学的统计能力，从而最大程度地减少了由于空间未对准或大脑拓扑差异而对变化的敏感性，并将由于组织位置而导致的变化而分离。我们证明了在阿尔茨海默氏病的OASIS-1研究的体积形态学分析的背景下，提出的最佳运输特征提取步骤。结果表明，所提出的方法可以识别组织的变化和差异，而这些差异是无法测量的。

translated by 谷歌翻译

A Recursive Partitioning Approach for Dynamic Discrete Choice Modeling in High Dimensional Settings

Ebrahim Barzegary , Hema Yoganarasimhan

分类： (统计)机器学习

2022-08-02

动态离散选择模型被广泛用于回答个人当前选择具有未来影响的设置中的实质性和政策问题。但是，这些模型的估计在高维环境中通常是计算密集型和/或不可行的。实际上，即使指定公用事业/国家过渡如何进入代理商的决定的结构，当我们没有指导理论时，在高维度中都有挑战。在本文中，我们介绍了动态离散选择模型的半参数公式，该模型还包含了一组高维状态变量，此外除了参数实用程序函数中使用的标准变量外。高维变量可以包括所有不是关注的主要变量的变量，但可能会影响人们的选择，并且必须包括在估计过程中，即控制变量。我们提出了一种数据驱动的递归分区算法，该算法通过考虑选择和状态转换的变化来降低高维状态空间的维度。然后，研究人员可以使用他们选择的方法使用第一阶段的离散状态空间来估计问题。我们的方法可以减少估计偏差，并同时使估计可行。我们提供了蒙特卡洛模拟，以证明我们的方法的性能与我们忽略高维解释变量集的标准估计方法相比。

translated by 谷歌翻译

ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer

Ebrahim Chekol Jibril , A. Cüneyd Tantğ

分类：自然语言处理 | 人工智能 | 机器学习

2022-07-02

命名实体识别是一项信息提取任务，可作为其他自然语言处理任务的预处理步骤，例如机器翻译，信息检索和问题答案。命名实体识别能够识别专有名称以及开放域文本中的时间和数字表达式。对于诸如阿拉伯语，阿姆哈拉语和希伯来语之类的闪族语言，由于这些语言的结构严重变化，指定的实体识别任务更具挑战性。在本文中，我们提出了一个基于双向长期记忆的Amharic命名实体识别系统，并带有条件随机字段层。我们注释了一种新的Amharic命名实体识别数据集（8,070个句子，具有182,691个令牌），并将合成少数群体过度采样技术应用于我们的数据集，以减轻不平衡的分类问题。我们命名的实体识别系统的F_1得分为93％，这是Amharic命名实体识别的新最新结果。

translated by 谷歌翻译

Deep learning-enhanced ensemble-based data assimilation for high-dimensional nonlinear dynamical systems

Ashesh Chattopadhyay , Ebrahim Nabizadeh , Eviatar Bach , Pedram Hassanzadeh

分类：机器学习

2022-06-09

数据同化（DA）是科学和工程中许多预测模型的关键组成部分。 DA允许使用系统的不完善动力学模型以及系统可用的嘈杂/稀疏观测来估算更好的初始条件。集合Kalman滤波器（ENKF）是一种DA算法，该算法广泛用于涉及高维非线性动力学系统的应用中。但是，ENKF需要使用系统的动力学模型来进化的大型预测集合。这通常在计算上棘手，尤其是当系统的状态数量很大时，例如天气预测。在小合奏的情况下，ENKF算法中的估计背景误差协方差矩阵患有采样误差，导致分析状态的错误估计（下一个预测周期的初始条件）。在这项工作中，我们提出了混合集合卡尔曼滤波器（H-ENKF），该滤波器被应用于两层准地球体流动系统作为测试案例。该框架利用了预先训练的基于学习的数据驱动的替代物，该替代物可廉价地生成和进化系统状态的大型数据驱动的集合，以准确计算背景错误协方差矩阵，而采样误差较少。 H-ENKF框架估算了更好的初始条件，而无需任何临时本地化策略。 H-ENKF可以扩展到任何基于集合的DA算法，例如粒子过滤器，这些粒子过滤器目前难以用于高维系统。

translated by 谷歌翻译

Neural Collapse: A Review on Modelling Principles and Generalization

Vignesh Kothapalli , Ebrahim Rasromani , Vasudev Awatramani

分类：机器学习

2022-06-08

随着Papyan等人最近对“神经崩溃（NC）”现象的观察，已经采取了各种努力来对其进行建模和分析。神经崩溃描述，在深层分类器网络中，与训练数据相关的最终隐藏层的类特征倾向于崩溃到各自的类功能均值。因此，将最后一层分类器的行为简化为最近级中心决策规则的行为。在这项工作中，我们分析了有助于从头开始对这种现象进行建模的原理，并展示他们如何建立对试图解释NC的最近提出的模型的共同理解。我们希望我们的分析对建模NC和有助于与神经网络的概括能力建立联系的多方面观点。最后，我们通过讨论进一步研究的途径并提出潜在的研究问题来得出结论。

translated by 谷歌翻译

Joint Cluster Head Selection and Trajectory Planning in UAV-Aided IoT Networks by Reinforcement Learning with Sequential Model

Botao Zhu , Ebrahim Bedeer , Ha H. Nguyen , Robert Barton , Jerome Henry

分类：机器学习

2021-12-01

雇用无人驾驶航空公司（无人机）吸引了日益增长的兴趣，并成为互联网（物联网）网络中的数据收集技术的最先进技术。在本文中，目的是最大限度地减少UAV-IOT系统的总能耗，我们制定了联合设计了UAV的轨迹和选择IOT网络中的群集头作为受约束的组合优化问题的问题，该问题被归类为NP-努力解决。我们提出了一种新的深度加强学习（DRL），其具有顺序模型策略，可以通过无监督方式有效地学习由UAV的轨迹设计来实现由序列到序列神经网络表示的策略。通过广泛的模拟，所获得的结果表明，与其他基线算法相比，所提出的DRL方法可以找到无人机的轨迹，这些轨迹需要更少的能量消耗，并实现近乎最佳性能。此外，仿真结果表明，我们所提出的DRL算法的训练模型具有出色的概括能力，对更大的问题尺寸而没有必要恢复模型。

translated by 谷歌翻译

CubeTR: Learning to Solve The Rubiks Cube Using Transformers

Mustafa Ebrahim Chasmai

分类：机器学习 | 人工智能

2021-11-11

自首次外观以来，变压器已成功地用于从计算机视觉到自然语言处理的广泛范围。最近提出了作为序列建模问题的重新加固钢筋学习中的变压器。与其他普遍探索的强化学习问题相比，Rubiks立方体构成了一系列独特的挑战。 Rubiks Cube具有用于千万可能配置的单个求解状态，这导致极其稀疏的奖励。所提出的模型Cubetrs参加了更长的行动序列，并解决了稀疏奖励的问题。 Cubetrys学习如何在没有任何人之前的任意起始状态下解决Rubiks立方体，并且在移动正则化之后，预期由专家溶剂使用的算法给出的解决方案的长度非常接近。 CUBetr提供了对较高维度立方体的学习算法的持久性以及变压器在其他相关稀疏奖励方案中的适用性的洞察力。

translated by 谷歌翻译

CoughTrigger: Earbuds IMU Based Cough Detection Activator Using An Energy-efficient Sensitivity-prioritized Time Series Classifier

Shibo Zhang , Ebrahim Nemati , Minh Dinh , Nathan Folkman , Tousif Ahmed , Mahbubur Rahman , Jilong Kuang , Nabil Alshurafa , Alex Gao

分类：机器学习

2021-11-07

持续咳嗽是呼吸系统疾病的主要症状。通过可穿戴物品来检测咳嗽，特别是在Covid-19大流行期间，已经支付了越来越多的研究。在所有类型的传感器中，麦克风最广泛地用于检测咳嗽。然而，处理音频信号所需的强力消耗阻碍了对电池限制的商业可穿戴产品（例如耳塞）的连续音频咳嗽检测。我们呈现了利用较低功率传感器，惯性测量单元（IMU）的COUGHTRIGGER作为咳嗽检测激活器，以触发更高功率的传感器，用于音频处理和分类。它能够以最小的电池消耗运行作为备用服务，并在从IMU检测到候选咳嗽时触发基于音频的咳嗽检测。此外，IMU的使用带来了改善咳嗽检测特异性的益处。实验是对45个科目进行的，我们的IMU的模型达到了0.77 AUC评分，留出了一个主题的评价。我们还验证了其对自由生活数据的有效性，并通过设备实现。

translated by 谷歌翻译